Nvidia a depășit toate așteptările miercuri, raportând profituri în creștere datorită unităților sale de procesare grafică (GPU) care excelează în gestionarea sarcinilor de lucru legate de inteligența artificială. Însă alte clase de cipuri AI încep să prindă avânt.
Fiecare furnizor important de cloud își proiectează acum propriile circuite integrate specifice aplicațiilor (ASIC), de la TPU de la Google la Trainium de la Amazon și până la planurile OpenAI cu Broadcom. Aceste cipuri sunt mai mici, mai ieftine, mai ușor de utilizat și ar putea reduce dependența acestor companii de GPU-urile Nvidia. Daniel Newman de la Futurum Group a declarat pentru CNBC că se așteaptă ca cipurile ASIC „să crească mai rapid decât piața GPU-urilor în următorii ani”.
Pe lângă GPU-uri și ASIC-uri, există matrici de porți programabile pe teren (FPGA), care pot fi reconfigurate după fabricație pentru utilizări precum procesarea semnalelor, crearea de rețele și inteligența artificială. Și există o întreagă generație de cipuri AI concepute să ruleze direct pe dispozitive, mai degrabă decât prin cloud - un segment condus de companii precum Qualcomm și Apple.
CNBC a discutat cu experți și persoane din interiorul companiilor importante de tehnologie pentru a analiza acest peisaj aglomerat și diferitele tipuri de cipuri AI.
GPU-uri pentru calcul de uz general
GPU-urile erau odată folosite în principal pentru jocuri video, dar au transformat Nvidia în cea mai valoroasă companie publică din lume odată ce au devenit motorul inteligenței artificiale moderne. Nvidia a livrat aproximativ 6 milioane de unități din GPU-urile sale „Blackwell” din generația actuală anul trecut.
Trecerea de la jocuri la inteligența artificială a început în 2012, când cercetătorii au antrenat rețeaua neuronală AlexNet folosind GPU-uri Nvidia - o descoperire pe care mulți o consideră scânteia revoluției moderne a inteligenței artificiale. AlexNet a concurat într-un concurs de recunoaștere a imaginilor de mare anvergură și s-a bazat pe GPU-uri mai degrabă decât pe procesoare, oferind o precizie uimitoare și un avantaj competitiv major.
Aceeași capacitate de procesare paralelă care face ca GPU-urile să poată reda grafică realistă le face ideale și pentru antrenarea modelelor de deep-learning, care învață din date mai degrabă decât din programare explicită.
Astăzi, GPU-urile sunt vândute în sisteme de centre de date asociate cu procesoare pentru a rula sarcini de lucru bazate pe inteligență artificială bazate pe cloud. CPU-urile au o mână de nuclee puternice pentru sarcini secvențiale, în timp ce GPU-urile au mii de nuclee mai mici specializate în operațiuni paralele, cum ar fi multiplicarea matriceală.
Deoarece pot executa un număr masiv de operații simultan, GPU-urile sunt ideale atât pentru antrenament, cât și pentru inferență. Antrenamentul învață modelele de inteligență artificială să găsească tipare în seturi de date uriașe; inferența folosește aceste modele pentru a lua decizii cu privire la informații noi.
GPU-urile rămân motorul principal pentru Nvidia și cel mai apropiat competitor al său, AMD. Software-ul este un factor cheie de diferențiere între ele: Nvidia se bazează pe ecosistemul său CUDA, în timp ce AMD oferă o stivă în mare parte open-source.
Ambele companii vând GPU-uri în cloud către furnizori precum Amazon, Microsoft, Google, Oracle și CoreWeave, care apoi închiriază puterea de calcul dezvoltatorilor de inteligență artificială.
Acordul de 30 de miliarde de dolari dintre Anthropic și Nvidia și Microsoft, de exemplu, include echivalentul a 1 gigawatt de capacitate de calcul construită pe hardware Nvidia. AMD a obținut recent angajamente majore și de la OpenAI și Oracle.
Nvidia vinde, de asemenea, direct către guverne și companii de inteligență artificială — inclusiv cel puțin 4 milioane de GPU-uri către OpenAI — și către guverne străine precum Coreea de Sud, Arabia Saudită și Marea Britanie.
Compania a declarat pentru CNBC că percepe aproximativ 3 milioane de dolari per dulap de server care conține 72 de GPU-uri Blackwell și că livrează aproximativ 1.000 de astfel de dulapuri în fiecare săptămână.
Dion Harris, directorul senior al Nvidia pentru infrastructura AI, a declarat că nu și-a imaginat niciodată că cererea va crește la acest nivel. „Când am vorbit cu companii despre un sistem cu opt GPU acum ani de zile, li s-a părut excesiv.”
ASIC-uri pentru inteligență artificială specializată în cloud
Antrenamentul bazat pe GPU a alimentat primul val de modele lingvistice mari, dar inferența a devenit din ce în ce mai importantă pe măsură ce modelele se maturizează. Inferența poate fi rulată pe cipuri mai puțin flexibile și cu costuri mai mici, construite special pentru anumite operații matematice - aici intervin ASIC-urile.
Dacă un GPU este un „briceag elvețian” care poate executa multe sarcini paralele diferite, un ASIC este un instrument cu un singur scop - extrem de rapid și eficient, dar blocat într-un singur tip de operațiune odată fabricat.
„Nu poți schimba aceste cipuri odată ce sunt gravate în siliciu”, a spus Chris Miller, autorul cărții *Chip War*. „Există un compromis între eficiență și flexibilitate.”
GPU-urile Nvidia sunt suficient de versatile pentru a satisface nenumărate nevoi de inteligență artificială, dar sunt scumpe (până la 40.000 de dolari pe unitate) și dificil de obținut. Startup-urile se bazează pe ele parțial pentru că proiectarea unui ASIC personalizat poate costa zeci de milioane.
Giganții cloud, însă, investesc masiv în ASIC-uri, deoarece acestea promit economii majore la scară largă.
„Aceste companii vor mai mult control asupra sarcinilor de lucru pe care le creează”, a spus Newman. „Dar vor continua să lucreze cu Nvidia și AMD - cererea de servicii de calcul este enormă.”
Google a fost prima companie care a construit un ASIC personalizat pentru inteligență artificială, lansând Tensor Processing Unit (TPU) în 2015. Lucrările au început în 2006, dar au devenit urgente în 2013, când Google și-a dat seama că inteligența artificială poate dubla dimensiunea amprentei centrului său de date. În 2017, TPU a contribuit la activarea arhitecturii Transformer care stă la baza majorității inteligenței artificiale moderne.
Google a dezvăluit în noiembrie cea de-a șaptea generație a procesoarelor de procesoare (TPU). Anthropic își va antrena modelul Claude pe un milion de TPU-uri. Unii cred că TPU-urile rivalizează - sau depășesc - GPU-urile Nvidia.
„Mulți oameni se așteaptă ca Google să facă în cele din urmă TPU-urile disponibile pe scară mai largă”, a spus Miller.
AWS a urmat cu propriile cipuri după achiziționarea Annapurna Labs în 2015. A lansat Inferentia în 2018 și Trainium în 2022, iar Trainium3 este așteptat în curând.
Amazon spune că Trainium oferă un raport calitate-preț cu 30% până la 40% mai bun decât alternativele. Anthropic folosește în prezent o jumătate de milion de cipuri Trainium2 pentru a-și antrena modelele.
Pentru a construi ASIC-uri personalizate, furnizorii de cloud se bazează pe companii precum Broadcom și Marvell — care furnizează expertiză critică în domeniul IP și al rețelelor. „De aceea, Broadcom a devenit unul dintre cei mai mari câștigători ai boom-ului inteligenței artificiale”, a spus Miller.
Broadcom a contribuit la proiectarea TPU-urilor Google și a acceleratoarelor Meta 2023 și construiește cipuri personalizate pentru OpenAI începând cu 2026.
Microsoft a dezvoltat Maia 100. Qualcomm are A1200. Intel oferă linia Gaudi. Tesla lucrează la cipul său AI5. Startup-uri precum Cerebras și Groq promovează arhitecturi inovatoare.
În China, Huawei, ByteDance și Alibaba își proiectează propriile ASIC-uri, în ciuda restricțiilor de export impuse de SUA.
IA la nivel de dispozitiv cu NPU-uri și FPGA-uri
O a treia categorie de cipuri AI este construită pentru a rula modele direct pe dispozitive, mai degrabă decât prin cloud. Aceste cipuri sunt de obicei integrate în designuri system-on-a-chip (SoC) și sunt cunoscute sub numele de procesoare edge-AI. Acestea permit funcțiilor AI să ruleze local și eficient, păstrând durata de viață a bateriei și confidențialitatea.
„Vei putea rula sarcini de inteligență artificială direct pe telefon, cu o latență extrem de scăzută”, a declarat Saif Khan, fost consilier pentru inteligență artificială și tehnologie la Casa Albă. „Și fără a trimite date către un centru de date.”
Unitățile de procesare neuronală (NPU) reprezintă o parte importantă a acestei categorii, fiind dezvoltate de Qualcomm, Intel, AMD și alții.
Apple nu folosește termenul NPU, dar încorporează un „motor neural” în cipurile sale Mac din seria M și în cipurile sale mobile din seria A.
„Această abordare s-a dovedit incredibil de eficientă”, a declarat Tim Millet, vicepreședintele Apple pentru arhitectura platformei. „Este rapidă și ne oferă mai mult control asupra experienței.”
Cipurile Snapdragon din telefoanele Android, unitățile de procesare a procesoarelor personalizate Samsung și procesoarele edge-AI de la NXP și Nvidia alimentează inteligența artificială din mașini, roboți, camere video și dispozitive inteligente pentru locuințe.
„Majoritatea cheltuielilor de astăzi sunt încă în centrele de date”, a spus Miller. „Dar acest lucru se va schimba pe măsură ce inteligența artificială se va răspândi în telefoane, mașini, dispozitive portabile și în orice altceva.”
FPGA-urile oferă și mai multă flexibilitate deoarece pot fi reprogramate după fabricație, deși sunt mai puțin eficiente din punct de vedere energetic decât ASIC-urile sau NPU-urile.
AMD a devenit cel mai mare producător de FPGA după ce a achiziționat Xilinx pentru 49 de miliarde de dolari în 2022. Intel ocupă locul al doilea după ce a cumpărat Altera pentru 16,7 miliarde de dolari în 2015.
Concluzie: Nvidia este încă mult înaintea celorlalți
Toate aceste companii producătoare de cipuri de inteligență artificială se bazează pe un singur producător: TSMC din Taiwan.
TSMC construiește o unitate de producție masivă în Arizona, unde Apple își va muta o parte din producție. CEO-ul Nvidia, Jensen Huang, a declarat în octombrie că GPU-urile Blackwell au ajuns și acolo la „producție maximă”.
În ciuda pieței din ce în ce mai aglomerate, detronarea Nvidia rămâne extrem de dificilă.
„Nvidia se află în această poziție pentru că a meritat-o”, a spus Newman. „A petrecut ani de zile construind acest ecosistem de dezvoltatori - și este cea care a câștigat.”
Majoritatea indicilor bursieri americani au crescut vineri, pe măsură ce optimismul privind potențialele reduceri ale ratelor dobânzii de la Rezerva Federală a reapărut.
John Williams, președintele Fed-ului din New York, a declarat vineri că se așteaptă ca banca centrală să aibă mai mult spațiu pentru a reduce ratele dobânzilor. Influentul factor de decizie politică, vorbind în Chile, a remarcat că riscurile pentru piața muncii depășesc acum pe cele legate de inflație, susținând poziția membrilor mai moderați ai FOMC.
Williams a declarat: „Consider că politica monetară este încă moderat restrictivă, deși mai puțin decât înainte de acțiunile noastre recente. Prin urmare, continui să văd posibilitatea unei ajustări suplimentare pe termen scurt a intervalului țintă pentru rata fondurilor federale pentru a aduce politica mai aproape de neutralitate și a menține echilibrul între cele două obiective ale noastre.”
În tranzacționare, indicele Dow Jones Industrial Average a crescut cu 0,4% (185 de puncte) până la 45.937, la ora 16:15 GMT. Indicele S&P 500, de asemenea, a crescut cu 0,1% (7 puncte), până la 6.545, în timp ce indicele Nasdaq Composite a câștigat 0,1% (38 de puncte), până la 22.040.
Prețurile paladiului și-au continuat scăderea vineri, sub presiunea unui dolar american mai puternic, a incertitudinii privind cererea și a așteptărilor privind o ofertă mai mare.
Reuters a relatat, citând surse bine informate, că Statele Unite fac presiuni private asupra Ucrainei pentru a accepta un acord de încetare a focului cu Rusia. O astfel de evoluție ar putea stimula oferta globală de metale industriale, pe măsură ce sancțiunile împotriva Rusiei - unul dintre cei mai mari exportatori de paladiu din lume - sunt relaxate.
Potrivit Capital.com, prețurile paladiului au crescut cu aproximativ 26% de la începutul lunii octombrie, ajungând la aproximativ 1.500 de dolari pe uncie. Creșterea a venit însoțită de câștiguri pe piața platinei și de o relaxare mai generală a condițiilor financiare globale.
Pariurile pe reducerile ratelor dobânzilor din SUA și slăbiciunea anterioară a dolarului au susținut, de asemenea, paladiul ca parte a așa-numitei creșteri „aur + lichiditate” care a ridicat valoarea metalelor prețioase în ultimele săptămâni.
Paladiul este utilizat aproape exclusiv în convertoarele catalitice pentru motoarele pe benzină, ceea ce înseamnă că orice volatilitate a prețurilor afectează direct structurile de costuri pentru producătorii auto și producătorii de electronice din SUA.
Analiza tehnică realizată de Monex indică o rezistență între 1.500 și 1.520 de dolari pe uncie, cu așteptări pentru o tendință generală ascendentă, dar cu continuarea tranzacțiilor agitate. Analiștii de la CPM Group au remarcat că creșterea recentă a paladiului este „strâns legată de performanța platinei”, avertizând în același timp că o piață a muncii din SUA în scădere și o inflație persistentă ar putea afecta cererea.
În ciuda unui armistițiu comercial recent anunțat între SUA și China, comentariile oficialilor americani sugerează că tensiunile rămân ridicate. Secretarul Trezoreriei SUA a declarat că China rămâne un partener comercial nesigur, în timp ce președintele Donald Trump a reiterat că administrația sa nu va permite exportul de cipuri Nvidia avansate către China sau alte țări.
Indicele dolarului american a crescut ușor cu 0,1%, ajungând la 100,2, la ora 14:43 GMT, tranzacționându-se între un maxim de 100,4 și un minim de 99,9.
Contractele futures pe paladiu cu livrare în decembrie au scăzut cu 0,9%, ajungând la 1.374 dolari pe uncie, la ora 14:43 GMT.
Bitcoin a scăzut pentru scurt timp la 81.871,19 dolari vineri dimineață, înainte de a se stabiliza în jurul valorii de 82.460 de dolari, în scădere cu aproximativ 10,2% în ultimele 24 de ore.
După aproape o lună de vânzări persistente, Bitcoin se tranzacționează acum cu 10% sub nivelul său de la începutul anului, după ce a șters majoritatea câștigurilor înregistrate după victoria electorală a lui Donald Trump de anul trecut.
Ultima dată când Bitcoin a scăzut sub 82.000 de dolari a fost în aprilie - când a scăzut la 75.000 de dolari - în timpul unei vânzări masive de piață declanșate de anunțul lui Trump privind tarife vamale drastice la evenimentul „Ziua Eliberării”.
Pe baza datelor de la Deribit — bursa de opțiuni și futures deținută de Coinbase — CoinDesk a raportat că traderii se poziționează pentru o scădere suplimentară.
Ethereum, a doua cea mai mare criptomonedă ca valoare de piață, a scăzut sub 2.740 de dolari, în scădere cu peste 9,6% în 24 de ore. Alte tokenuri majore au fost, de asemenea, supuse unei presiuni puternice, XRP, BNB și SOL scăzând cu 9,1%, 8,4% și, respectiv, 10,6%. Dogecoin - cea mai mare monedă meme - a pierdut 10,3% în aceeași perioadă.
După ce a atins noi recorduri la începutul lunii trecute, piața criptomonedelor a suferit scăderi constante în urma unei prăbușiri fără precedent într-o singură zi pe 10 octombrie, când 19,37 miliarde de dolari în poziții cu efect de levier au fost lichidate în 24 de ore. Evenimentul a fost declanșat de anunțul lui Trump privind un tarif suplimentar de 100% asupra importurilor chinezești - o mișcare pe care acesta a retras-o ulterior. Activele digitale au fost, de asemenea, prinse în volatilitatea mai largă a pieței în ultimele zile, cu peste 2,2 miliarde de dolari lichidați în 24 de ore, potrivit CoinGlass.
Valoarea totală de piață a tuturor criptomonedelor se ridică acum la 2,92 trilioane de dolari, potrivit CoinGecko - o scădere de 33% față de vârful de aproximativ 4,38 trilioane de dolari atins la începutul lunii octombrie. De la începutul acestei luni, capitalizarea de piață a Bitcoin a scăzut cu aproximativ 25%, marcând cel mai abrupt declin lunar de la prăbușirea cripto din 2022, potrivit Bloomberg.
Acțiunile Strategy (fosta MicroStrategy) — considerată pe scară largă ca un indicator al Bitcoin datorită deținerilor sale masive — au scăzut cu 2,44% în tranzacțiile premergătoare pieței de vineri, după ce au scăzut cu 11% în ultima săptămână și cu 41% în ultimele 30 de zile. Compania deține în prezent 649.870 BTC la un preț mediu de achiziție de 74.430 USD.
Într-o notă emisă la începutul acestei săptămâni, analiștii JPMorgan au avertizat că Strategy se confruntă cu riscul de a fi eliminată din indici majori precum Nasdaq 100 și MSCI USA. O astfel de excludere ar putea duce la scăderi suplimentare ale acțiunilor sale și ar putea afecta piețele cripto dacă firma este forțată să vândă o parte din deținerile sale de Bitcoin.